在边缘计算芯片这些技术困境下,云天励飞做了哪些事情?首先是云天励飞正在自研“云天天书”大模型,这个大模型是基于云天的算法开放平台和算法芯片化平台,通过结合互联网上海量的语料数据,训练出通用的基础大模型。在通用基础大模型的基础上,结合云天励飞过去九年来的沉淀积累,训练出行业大模型,这里面就包括智慧城市、智慧安防、智慧交通、智慧商超等等,这些领域的行业大模型。之后再针对落地细分的场景,将数据集进行微调,从而实现真正可落地的,满足场景泛化要求的场景大模型。云天天书大模型也是由CV大模型、NLP大模型和多模态大模型组成。在芯片侧,云天励飞打造了新一代的边缘计算芯片平台DeepEdge10。它是一个系列化的芯片平台。它是基于国产的工艺,可以说这颗芯片是真正的国产芯片。其次它采用了先进的Chiplet技术,它能实现算力的灵活扩展。DeepEdge10是具有SoC主控集成度的芯片,内置了云天最新的第四代神经网络处理器,可以高效支持大模型边缘侧的执行和落地。另外它实现了D2D Chiplet创新技术,同时实现了D2D/C2C Mash扩展架构,来实现算力的灵活可扩展。在主控集SoC方面,DeepEdge10具有性能强劲的、主流的CPU核。另外它集成了满足边缘场景应用的2D/3D的GPU能力,同时集成了第四代神经网络处理器400T,所以它具有澎湃的边缘AI的算力。它还有强大的多媒体能力,包括对于8K30视频以及2亿像素的图像处理能力,还有不错的显示能力,支持双屏异显等等。它有完备的高低速外围接口,例如我们熟悉的USB、PCI等,包括以太网口都全部支持,甚至还支持CAN FD,可以满足工业场景的实时连接需要。同时,它具有硬件级安全特性,支持国际主流的加解密算法,同时支持安全boot,以及物理级的安全系统。DeepEdge10内置了云天励飞第四代神经网络处理器,具有这些特点:首先它的数据格式,它是支持FP16、INT16和INT8这些精度,因为有了这些支持,我们得以做混合精度量化。另外支持多线程执行,同时支持QAT模型、支持动态量化模型、支持最新的Transformer网络结构模型。对于大模型的新的计算,我们有哪些考虑呢?首先是我们设计了三维并行的矩阵计算架构。结合矩阵计算和矢量计算的联合优化,我们可以高效地提升像Softmax、LayerNorm这些算子的性能。通过稀疏化、参数/数据的压缩和低比特量化技术,我们可以实现大模型对带宽要求的极致优化。通过INT8、INT16、FP16,可以实现混合数据精度的量化,从而保证大模型在边缘侧落地的时候几乎不掉精度。通过D2D以及C2C的高速互联接口,可以实现算力的灵活扩展。DeepEdge10芯片是国内首个基于国产工艺量产的D2D Chiplet芯片。D2D就是die to die,意味着两个die之间高速互联。我们采用的die to die技术具有非常高的速率,还有带宽的密度、pJ级功耗级别,以及纳米级延时等等,包括传输、路由、统一内存等等。因为有了这些特性,所以我们才能够负责任地说,我们可以支持当前的大模型,包括百亿大模型乃至千亿大模型参数大、计算量大、低延时的要求。通过以上的创新,云天励飞打造了DeepEdge10这样基于国产工艺的芯片平台,我们形成了一个系列化的芯片。这样的芯片平台我们可以有效地支持当前在边缘计算场景落地的,从迷你PCIe卡、AI盒子、加速卡,到边缘服务器等各类硬件产品的需要,从而实现整个丰富边缘计算场景的落地。我们通过架构的创新,可以说DeepEdge10实现了国产芯片在边缘计算场景的突围。云天励飞致力于国产工艺以及国产大模型边缘计算芯片的突围,不论遭受怎样的外部压力,我们矢志不渝。谢谢大家!以上是李爱军演讲内容的完整整理。